智能论文笔记

Composite Fixed-Length Ordered Features for Palmprint Template Protection with Diminished Performance Loss

Weiqiang Zhao , Heng Zhao , Zhicheng Cao , Liaojun Pang

分类：计算机视觉

2022-11-09

Palmprint recognition has become more and more popular due to its advantages over other biometric modalities such as fingerprint, in that it is larger in area, richer in information and able to work at a distance. However, the issue of palmprint privacy and security (especially palmprint template protection) remains under-studied. Among the very few research works, most of them only use the directional and orientation features of the palmprint with transformation processing, yielding unsatisfactory protection and identification performance. Thus, this paper proposes a palmprint template protection-oriented operator that has a fixed length and is ordered in nature, by fusing point features and orientation features. Firstly, double orientations are extracted with more accuracy based on MFRAT. Then key points of SURF are extracted and converted to be fixed-length and ordered features. Finally, composite features that fuse up the double orientations and SURF points are transformed using the irreversible transformation of IOM to generate the revocable palmprint template. Experiments show that the EER after irreversible transformation on the PolyU and CASIA databases are 0.17% and 0.19% respectively, and the absolute precision loss is 0.08% and 0.07%, respectively, which proves the advantage of our method.

translated by 谷歌翻译

ImDrug: A Benchmark for Deep Imbalanced Learning in AI-aided Drug Discovery

Lanqing Li , Liang Zeng , Ziqi Gao , Shen Yuan , Yatao Bian , Bingzhe Wu , Hengtong Zhang , Chan Lu , Yang Yu , Wei Liu

分类：机器学习 | 人工智能

2022-09-16

在过去的十年中，AI AID毒品发现（AIDD）的计算方法和数据集策划的繁荣发展。但是，现实世界中的药物数据集经常表现出高度不平衡的分布，这在很大程度上被当前的文献忽略了，但可能会严重损害机器学习应用程序的公平性和概括。在这一观察结果的激励下，我们介绍了Imdrug，这是一个全面的基准标准，其开源python库由4个不平衡设置，11个AI-Ready数据集，54个学习任务和16种为不平衡学习量身定制的基线算法。它为涵盖广泛的药物发现管道（例如分子建模，药物靶标相互作用和逆合合成）的问题和解决方案提供了可访问且可定制的测试床。我们通过新的评估指标进行广泛的实证研究，以证明现有算法在数据不平衡情况下无法解决药物和药物挑战。我们认为，Imdrug为未来的研究和发展开辟了途径，在AIDD和深度不平衡学习的交集中对现实世界中的挑战开辟了道路。

translated by 谷歌翻译

Multi-target Tracking of Zebrafish based on Particle Filter

Heng Cong , Mingzhu Sun , Duoying Zhou , Xin Zhao

分类：计算机视觉

2022-08-09

斑马鱼是一种出色的模型生物，已在生物实验，药物筛查和群智能领域广泛使用。近年来，有许多用于跟踪行为研究涉及斑马鱼的技术，这使其攻击许多领域的科学家的注意力。斑马鱼的多目标跟踪仍然面临许多挑战。高流动性和不确定性使得难以预测其运动；相似的外观和纹理功能使建立外观模型变得困难。由于频繁的阻塞，甚至很难将轨迹连接起来。在本文中，我们使用粒子过滤器来近似运动的不确定性。首先，通过分析斑马鱼的运动特性，我们建立了一个有效的混合运动模型来预测其位置。然后，我们根据预测位置建立一个外观模型，以预测每个目标的姿势，同时通过比较预测的姿势和观察姿势的差来称量颗粒；最后，我们通过加权位置获得了单斑马鱼的最佳位置，并使用关节颗粒过滤器来处理多个斑马鱼的轨迹链接。

translated by 谷歌翻译

Pseudo-label Guided Cross-video Pixel Contrast for Robotic Surgical Scene Segmentation with Limited Annotations

Yang Yu , Zixu Zhao , Yueming Jin , Guangyong Chen , Qi Dou , Pheng-Ann Heng

分类：计算机视觉

2022-07-20

手术场景细分对于促使机器人手术的认知援助至关重要。但是，以逐帧方式以像素为单位的注释视频是昂贵且耗时的。为了大大减轻标签负担，在这项工作中，我们从机器人手术视频中研究了半监督的场景细分，这实际上是必不可少的，但以前很少探索。我们考虑在等距采样下的临床上适当的注释情况。然后，我们提出了PGV-CL，这是一种新型的伪标签引导的跨视频对比学习方法，以增强场景分割。它有效地利用了未标记的数据来实现可信赖和全球模型的正则化，从而产生更具歧视性的特征表示。具体来说，对于可信赖的表示学习，我们建议合并伪标签以指导对选择，从而获得更可靠的代表对像素对比度。此外，我们将代表学习空间从以前的图像级扩展到交叉视频，该图像可以捕获全球语义以使学习过程受益。我们广泛评估了公共机器人手术数据集Edovis18和公共白内障数据集Cadis的方法。实验结果证明了我们方法的有效性，在不同的标签比下始终超过了最先进的半监督方法，甚至超过了10.1％标签的destovis18上的全面监督培训。

translated by 谷歌翻译

Structure-consistent Restoration Network for Cataract Fundus Image Enhancement

Heng Li , Haofeng Liu , Huazhu Fu , Hai Shu , Yitian Zhao , Xiaoling Luo , Yan Hu , Jiang Liu

分类：计算机视觉

2022-06-09

眼底摄影是诊断和监测眼部疾病的诊所的常规检查。但是，对于白内障患者，底眼图像始终会遭受由云晶状体引起的质量降解。降解阻止了眼科医生或计算机辅助系统可靠的诊断。为了提高临床诊断的确定性，已经提出了恢复算法来提高眼底图像的质量。不幸的是，这些算法的部署仍然存在挑战，例如收集足够的培训数据和保存视网膜结构。在本文中，为了规避严格的部署要求，从共享相同结构的合成数据中开发出了针对白内障底底图像的结构一致的恢复网络（SCR-NET）。白内障仿真模型首先是设计用于收集由白内障底面图像共享相同结构的合成性白内障集（SC）的。然后从SCS中提取高频组件（HFC）以约束结构一致性，从而强制执行SCR-NET中的结构保留。该实验证明了SCR-NET与最新方法和后续临床应用的比较中的有效性。该代码可从https://github.com/liamheng/arcnet-medical-image-enhancement获得。

translated by 谷歌翻译

Exploring Intra- and Inter-Video Relation for Surgical Semantic Scene Segmentation

Yueming Jin , Yang Yu , Cheng Chen , Zixu Zhao , Pheng-Ann Heng , Danail Stoyanov

分类：计算机视觉

2022-03-29

自动手术场景细分是促进现代手术剧院认知智能的基础。以前的作品依赖于常规的聚合模块（例如扩张的卷积，卷积LSTM），仅利用局部环境。在本文中，我们提出了一个新颖的框架STSWINCL，该框架通过逐步捕获全球环境来探讨互补的视频内和访问间关系以提高细分性能。我们首先开发了层次结构变压器，以捕获视频内关系，其中包括来自邻居像素和以前的帧的富裕空间和时间提示。提出了一个联合时空窗口移动方案，以有效地将这两个线索聚集到每个像素嵌入中。然后，我们通过像素到像素对比度学习探索视频间的关系，该学习很好地结构了整体嵌入空间。开发了一个多源对比度训练目标，可以将视频中的像素嵌入和基础指导分组，这对于学习整个数据的全球属性至关重要。我们在两个公共外科视频基准测试中广泛验证了我们的方法，包括Endovis18 Challenge和Cadis数据集。实验结果证明了我们的方法的有希望的性能，这始终超过了先前的最新方法。代码可在https://github.com/yuemingjin/stswincl上找到。

translated by 谷歌翻译

Rethinking Task Sampling for Few-shot Vision-Language Transfer Learning

Zhenhailong Wang , Hang Yu , Manling Li , Han Zhao , Heng Ji

分类：自然语言处理 | 计算机视觉

2022-03-09

尽管达到了最新的零击性能，但现有的视觉语言模型仍然缺乏针对域特异性问题的几乎没有传输能力。经典的微调通常无法阻止高度表达模型利用虚假相关性。尽管模型不足的元学习（MAML）作为几次转移学习的天然替代方案，但由于隐式二阶优化而引起的昂贵计算限制了其在大规模视觉语言模型（例如剪辑）上的使用。尽管许多文献都致力于探索替代优化策略，但我们确定了有效的几次转移学习，任务抽样的另一个基本方面，以前仅将其视为MAML中数据预处理的一部分。为了显示任务采样的影响，我们提出了一种简单的算法，模型不合时宜的多任务微调（MAMF），该算法仅在均匀地采样多个任务上区分了经典的微调。尽管它很简单，但我们表明，MAMF在五个几乎没有视觉语言分类任务上始终优于经典的微调。我们进一步表明，MAML中BI级优化的有效性对在几乎没有射击视觉分类的上下文中对任务的零弹性性能高度敏感。本文的目的是提供有关几乎没有成功学习工作的新见解，并鼓励更多的研究来研究更好的任务抽样策略。

translated by 谷歌翻译

Differentiable Moving Horizon Estimation for Robust Flight Control

Bingheng Wang , Zhengtian Ma , Shupeng Lai , Lin Zhao , Tong Heng Lee

分类：机器人

2021-08-06

对外部干扰的估计和反应对于对准轮运动器的鲁棒控制是根本的重要性。现有估计人通常需要大量数据，包括地面真理的大量数据，以实现令人满意的性能。本文提出了一种数据有效的可微分运动地平线估计（DMHE）算法，可以在线自动调整MHE参数，并适应不同的场景。我们通过从MHE相对于调谐参数导出估计的轨迹的分析梯度来实现这一点，使能够进行自动调整的端到端学习。最有趣的是，我们表明可以从递归形式的卡尔曼滤波器有效地计算梯度。此外，我们开发了一种基于模型的策略梯度算法，可以直接从轨迹跟踪误差中学习参数，而无需对实际真理。所提出的DMHE可以进一步嵌入为具有用于联合优化的其他神经网络的层。最后，我们通过在四轮官上的模拟和实验中展示了所提出的方法的有效性，其中检查了突然有效载荷变化和飞行中的具有挑战性的情景。

translated by 谷歌翻译

End-to-end Robustness for Sensing-Reasoning Machine Learning Pipelines

Zhuolin Yang , Zhikuan Zhao , Boxin Wang , Jiawei Zhang , Linyi Li , Hengzhi Pei , Bojan Karlas , Ji Liu , Heng Guo , Bo Li

分类：机器学习 | (统计)机器学习

2020-02-28

最近已经采取了密集的算法努力来实现复杂ML模型的认证鲁棒性快速改善。但是，当前的鲁棒性认证方法只能在有限的扰动半径下进行认证。鉴于现有的纯数据驱动的统计方法已经达到了瓶颈，因此我们建议将统计ML模型与知识（以逻辑规则表示为逻辑规则）作为使用Markov Logic Networks（MLN（MLN）（以进一步提高）的推理组件，以进一步改善总体认证的鲁棒性。这为证明这种范式的鲁棒性，尤其是推理组成部分（例如MLN）开辟了新的研究问题。作为理解这些问题的第一步，我们首先证明了证明MLN鲁棒性的计算复杂性是＃p-hard。在这种硬度结果的指导下，我们通过仔细分析不同的模型制度来得出第一个用于MLN的认证鲁棒性。最后，我们对五个数据集进行了广泛的实验，包括高维图像和自然语言文本，以及自然语言文本，以及我们表明，具有基于知识的逻辑推理的经认证的鲁棒性确实胜过了T。心。

translated by 谷歌翻译

Robust Domain Adaptive Object Detection with Unified Multi-Granularity Alignment

Libo Zhang , Wenzhang Zhou , Heng Fan , Tiejian Luo , Haibin Ling

分类：计算机视觉

2023-01-01

Domain adaptive detection aims to improve the generalization of detectors on target domain. To reduce discrepancy in feature distributions between two domains, recent approaches achieve domain adaption through feature alignment in different granularities via adversarial learning. However, they neglect the relationship between multiple granularities and different features in alignment, degrading detection. Addressing this, we introduce a unified multi-granularity alignment (MGA)-based detection framework for domain-invariant feature learning. The key is to encode the dependencies across different granularities including pixel-, instance-, and category-levels simultaneously to align two domains. Specifically, based on pixel-level features, we first develop an omni-scale gated fusion (OSGF) module to aggregate discriminative representations of instances with scale-aware convolutions, leading to robust multi-scale detection. Besides, we introduce multi-granularity discriminators to identify where, either source or target domains, different granularities of samples come from. Note that, MGA not only leverages instance discriminability in different categories but also exploits category consistency between two domains for detection. Furthermore, we present an adaptive exponential moving average (AEMA) strategy that explores model assessments for model update to improve pseudo labels and alleviate local misalignment problem, boosting detection robustness. Extensive experiments on multiple domain adaption scenarios validate the superiority of MGA over other approaches on FCOS and Faster R-CNN detectors. Code will be released at https://github.com/tiankongzhang/MGA.

translated by 谷歌翻译